# View(cars) # visualizar conjunto de datosclase 04 parte 2
Inspección conjunto de datos
Se inspecciona un conjunto de datos (dataset) que trae pregargado R
- visualizar conjunto de datos
- investigar cuál información contiene el conjunto
?cars- Sumar todos los valores presentes en la columna speed. Luego se explicará
sum(cars$speed)[1] 770
el papel que juega el signo $ presente en la expresión anterior
- obtener valor promedio de la columna distancia
mean(cars$dist)[1] 42.98
Visualización valores del conjunto de datos
En cada gráfico que generemos mejoraremos la visualización representada
- Función plot para representar puntos generados por speed y dist
plot(cars)- Añadir etiquetas en los ejes
plot(cars,
xlab = "Velocidad (mph)",
ylab = "Distancia detenido (ft) ")Observar que a nivel de código, en las líneas inferiores que siguen a plot queda un espacio al inicio de cada línea. Ese espacio lo coloca automáticamente el editor de código, si estamos escribiendo el código de la función plot o la que sea, y luego apretamos enter. Esos espacios que aparecen, se llaman indentado, y son de ayuda para leer el código de una forma más legible. Al avanzar en las otras clases, se comprenderá mejor de qué va esto
- Gráfico de dispersión
Los gráficos de dispersión pueden ayudar a visualizar cualquier relación lineal entre la variable dependiente (respuesta) y las variables independientes (predictoras). Lo ideal es que, si se dispone de múltiples variables predictoras, se dibuje un gráfico de dispersión para cada una de ellas frente a la respuesta
scatter.smooth(x=cars$dist,
y=cars$speed,
main="Distancia ~ Velocidad") Ejercicio: - Analizar cuál es la relación que pueden presentar las dos variables - Si el gráfico lo represento de esta forma, tiene el mismo significado? - Cuál puede ser la relación que presuponemos que tienen las variables?
- Modificación en la representación (ejes):
scatter.smooth(y=cars$dist,
x=cars$speed,
main="Distancia ~ Velocidad") Preguntas: - Si el comportamiento de dependencia cumple determinados supuestos, se puede predecir? - Se puede modelar?
Mejorar el gráfico
La siguiente sección usa una librería llamada ggplot2 para crear el gráfico que tienemucho mejor aspecto. Luego, en clases venideras, se explicará línea a línea, cómo se creó el gráfico, pero se coloca para crear entusiasmo hacia el aprendizaje del lenguaje
library(ggplot2) # debemos tener instalados los paquetes
ggplot(cars,
mapping= aes(x=speed,y=dist))+
geom_point(colour = 'red', size = 3)mismos valores pero con puntos en color rojo, líneas en ambos ejes para crear una grilla
y ahora el mismo gráfico con la línea de tendencia y lo asignamos a una variable que se llama grafico
ahora llamamos a la variable grafico para ver la nueva versión
grafico`geom_smooth()` using method = 'loess' and formula = 'y ~ x'
Finalmente, mediante un paquete de nombre plotly lo convertimos en interactivo. Pasar el mouse sobre el gráfico para que se pueda apreciar la interactividad
library(plotly)# cargamos la librería
Attaching package: 'plotly'
The following object is masked from 'package:ggplot2':
last_plot
The following object is masked from 'package:stats':
filter
The following object is masked from 'package:graphics':
layout
grafico%>%
ggplotly()`geom_smooth()` using method = 'loess' and formula = 'y ~ x'